流程挖掘技术概述与发展趋势
流程挖掘(Process mining),也译为过程挖掘,从学科发展角度来看它并不是一个新鲜事物,但是在我国产业界被广泛关注还是在2020年以后,作为超自动化的关键技术被国际知名咨询机构Gartner连续3次收录到其年度技术趋势报告中。根据2022年中国信通院发布的《超级自动化技术与应用研究报告》,超自动化是一个技术合集,换言之就是一组实现企业业务流程自动化的技术。具体包括:机器人流程自动化(RPA)、低代码应用平台、智能业务流程管理系统(iBPMS)和流程挖掘等。当然,以上这些功能型的技术也是建立在大数据、人工智能、云计算和深度学习的基础理论之上。
01
流程挖掘与企业数字化转型
图1 超自动化技术助力企业数字化转型闭环
图1给出了基于超自动化技术实现企业数字化转型的路线图。具体而言,企业数字化转型的起点是业务信息系统,如企业资源管理系统(ERP)、客户资源管理系统(CRM)和办公系统(OA)等,更确切地来说是业务信息系统中记录的业务数据。首先,通过数据收集和预处理技术,把业务数据转化为流程挖掘工具可以直接分析的标准事件日志,并以此为输入进行流程模型挖掘和关键流程性指标分析,进而理解业务流程实际运行的全貌。其次,进行业务流程的深度分析和洞察,包括性能分析、合规性检查和偏差根因分析等。基于以上分析结果,针对运行流程中的性能瓶颈和行为偏差有针对性地进行流程的数字化再造。比如对违规和缺少信息系统支撑的业务,通过低代码技术和业务流程管理系统对业务进行快速搭建和重构,对执行效率比较低、返工率高的流程节点,通过部署RPA机器人来提高流程节点的局部效率进而优化全局的效率。除了以上基于离线事件日志的分析技术,还可以基于流程预测性监控和预警技术来对业务流程运行进行实时管控。综上所述,流程挖掘作为超自动化的底座技术,起到了关联业务系统、业务数据以及其他超自动化技术的作用,是当前实现企业数字化转型的核心关键技术。
02
流程挖掘的学科定位
与RPA和低代码技术不同的是,流程挖掘不仅仅是一门技术,它更是一门学科!作为一门学科,它既有相对完备的理论技术,又有核心算法,此外,流程挖掘还有典型的应用场景(详情请参考中国流程挖掘行业研究报告)。根据“流程挖掘之父”、德国亚琛工业大学Wil van der Aalst教授的论述,流程挖掘是建立在流程科学与数据科学之间的一个跨领域交叉学科,其学科定位如图2所示。
图2 流程挖掘学科定位
具体而言,流程科学涉及到形式化方法、Petri网理论、并发论、工作流管理与流程自动化等领域。数据科学则涉及到数据挖掘、机器学习、统计学、分布式计算和可视化理论等领域。
03
流程挖掘发展历程与产业概述
图3 流程挖掘发展历程图
接下来我们回顾一下流程挖掘的发展历程,如图3所示。具体而言,流程挖掘理论研究起源于1999年,Wil教授在荷兰埃因霍芬理工大学(Eindhoven University of Technology, TU/e)成立流程挖掘研究小组;产业起源于2007年,Futura PI公司成立于荷兰埃因霍芬。国际上第一波发展高潮是2009-2011年这个时间段,标志性的事件包括:IEEE成立了流程挖掘工作组、Wil教授出版了全球首部流程挖掘专著、Process Gold、Fluxicon和Celonis等流程挖掘公司相继成立,第一波的流程挖掘行业发展本质上是学术研究带动产业发展。国际上第二波发展高潮是2018-2021年这个时间段,标志性的事件包括:Gartner开始针对流程挖掘这一细分领域发布行业指南、Celonis经过10年的发展成为德国独角兽企业(估计达到110亿美金)、成功举办首届流程挖掘行业学术年会,第二波流程挖掘行业的发展已经是产业为主带动学术研究了。直到2021年,Wil教授宣布加入Celonis担任首席科学家,学术和产业实现了一个很好的融合。相比而言,国内第一波发展高潮是2021年前后,中间相差了大约10年的时间。
流程挖掘作为一门相对年轻的应用型学科,经过20年的快速发展,目前已经发展为有基础理论和核心算法、有学术开源工具、有专著、有行业年会、有行业学术组织、有典型的商业产品和成功案例。
图4 国际知名流程挖掘提供商
图4汇总了国际上典型的流程挖掘产品提供商,其中包括流程挖掘明星企业Celonis、RPA巨头UiPath (2021年收购ProcessGold)、IT巨头微软(minit)和IBM(myInvenio)、SAP(Signavio)等等。图5是出自Gartner 2023年3月发布的流程挖掘工具魔力象限(Magic Quadrant for Process Mining Tools),给出了国际上不同流程挖掘厂商产品力的比较结果。
图5 2023年Gartner流程挖掘工具魔力象限
04
国内流程挖掘产品能力与面临的挑战
相比于国外十余年的产业积累,2021年可以定位为我国流程挖掘产业化的元年,也是在这一年出现了10多家提供流程挖掘产品的公司。
图6 我国主要流程挖掘提供商
图6汇总了我们国内流程挖掘产品的提供商(笔者如有遗漏,还请联系补充),大致可分三类:(1) 单纯以流程挖掘为核心产品的流程挖掘创业企业,如北京凡得科技的流程挖掘产品Process X;(2) RPA厂商,为了扩展产品矩阵增加了流程挖掘产品,如弘玑cyclone公司的流程挖掘产品;(3) 跨国公司中国区,如SAP中国提供的流程挖掘产品Signavio、IBM中国的流程挖掘产品myInvenio和UiPath的产品。
图7 流程挖掘产品核心能力
图7汇总了国内流程挖掘产品的核心能力,具体包括如下核心功能:(1) 流程挖掘的起点是企业的各类业务信息系统,首先是事件日志的提取、数据建模和预处理;(2) 以事件日志为输入进行模型挖掘,得到一个能够描述业务流程的图形化表达;(3) 以流程模型和事件日志为输入,进行合规性检查和性能分析,找到性能和行为偏差;(4) 针对得到的性能和行为偏差,进行根因分析,发现产生偏差的根本原因;(5) 前面都是传统的流程挖掘,近年来随着人工智能、深度学习的发展,实时/准实时的流程预测性监控得到越来越多的关注,主要包括剩余时间、下一个活动、结果的实时预测等等。
虽然近年来国内流程挖掘学术研究和产业均有较好的发现,但是核心技术和算法方面仍然存在如下瓶颈:(1) 数据提取耗时,缺乏高效的ETL提取工具和方法论,一般数据提取的时间能占到流程挖掘项目实施的80%;(2) 数据质量难以保证,如噪声、不完整轨迹、属性缺失和缺少事件关联等问题突出;(3) 模型挖掘结果的可靠性难以保证,已有大部分商业工具用有向图来作为流程模型的描述,但有向图在描述业务流程时存在天然的局限,虽然部分工具支持BPMN模型挖掘,但是模型挖掘的质量还难以保证;(4) 合规性检查准确率有待提高,作为典型的流程挖掘应用场景,流程的合规性检查目前得到的关注较低,已有的商业化工具大都无法提供精准的诊断结果;(5) 根因分析结果较为初级,缺乏系统化的根因分析工具;(6) 流程预测效率和准确性有待提高,缺乏系统化的流程案例剩余时间预测、下一事件预测和结果预测的分析工具。
图8 国内流程挖掘行业发展挑战
如图8 所示,我国流程挖掘行业面临如下挑战:(1) 产业起步晚、产品成熟地低:相比于国外10余年的产业积累,我国产业起步较晚,2021年才算是正式开启这个赛道。产品的完整度和成熟度方面还有一定的差距;(2) 行业人才少、项目经验不足:相比于国外10多年人才和项目的积累,我国流程挖掘行业从业者数量有限,同时由于产业刚起步,有项目经验的人才就更少了,这可能是未来制约我国流程挖掘产业快速发展的一个潜在瓶颈;(3) 原始学术积累有限:相比于国外20年的原始创新积累,我国流程挖掘领域的学术积累明显不足,同时学术研究的规模和质量也还没有在国际形成较大的影响力,专注于流程挖掘的高校也相对有限。因此,建议在我国流程挖掘行业的启蒙阶段,从一开始就确立产学研相结合的模式,充分发挥高校和科研院所在人才培养和学术创新方面的优势。
作者简介:刘聪,山东理工大学二级教授、博士生导师,山东省泰山学者青年专家,山东省自然科学基金优秀青年基金获得者(省优青),山东省青年科技奖获得者,IEEE流程挖掘工作组成员。博士毕业于荷兰埃因霍芬理工大学(Eindhoven University of Technology),师从欧洲科学院院士、“流程挖掘之父”Wil van der Aalst教授。目前兼任凡得科技首席技术顾问和RPA中国研究院流程挖掘首席技术顾问。Email: liucongchina@163.com